輝達2026年的首場重頭戲比以往來得更早。當地時間1月5日,在美國CES上,黃仁勳出乎意料地提前發佈了下一代AI晶片平台“Rubin”,打破了輝達通常在每年3月GTC大會上集中公佈新一代架構的傳統。AI競賽進入推理時代,輝達決定加速出擊。Vera Rubin已投產Rubin並非空降。早在2025年3月的GTC大會上,黃仁勳就已預告了代號“Vera Rubin”的超級晶片,並明確其將於2026年量產。此次在CES上,黃仁勳對Rubin平台進行了系統性發佈,Rubin成為輝達最新GPU的代號。“Rubin的到來正逢其時。無論是訓練還是推理,AI對計算的需求都在急劇攀升。”黃仁勳表示,“我們堅持每年推出新一代AI超級電腦,通過六顆全新晶片的極致協同設計,Rubin正在向AI的下一個前沿邁出巨大一步。”Rubin平台採用極端協同設計理念,整合了6顆晶片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交換晶片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6乙太網路交換晶片,覆蓋了從計算、網路到儲存與安全的多個層級。相比前代Blackwell架構,Rubin加速器在AI訓練性能上提升3.5倍,運行性能提升5倍,並配備擁有88個核心的新款中央處理器(CPU)。相比輝達Blackwell平台,Rubin平台實現推理token成本最高可降低10倍,訓練MoE(專家混合)模型所需GPU數量減少4倍。同時,Vera Rubin NVL72機櫃級系統和平台同步發佈,命名上非外界預計的NVL144。對此,輝達高管在溝通會上向21世紀經濟報導等記者指出,NVL72指的是72個GPU封裝單元,每個封裝內部包含2個Rubin Die,因此系統中實際包含144個Rubin Die,這並不意味著系統規模變化。在生態層面,Rubin已獲得頭部雲廠商和模型公司的集中響應。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批採用名單。Rubin在CES的提前亮相,也引發了外界對輝達產品發佈節奏變化的關注。對此,輝達高管回應稱,目前構成Vera Rubin平台的六顆晶片已經全部到位,相關系統已在運行真實應用負載,並取得了積極結果。此次在CES上提前披露Rubin,主要是為了儘早向生態夥伴提供工程樣品,方便其為後續部署和規模化應用做準備。輝達同時強調,Rubin仍將按照既定節奏推進,計畫在今年下半年進入量產爬坡階段,這一時間安排與此前披露的路線圖保持一致。全端AI佈局隨著AI進入推理階段,黃仁勳展示的不只是Rubin平台。在CES演講中,輝達還發佈了一系列AI體系產品,包括開源模型、AI儲存、物理AI等。這是輝達的全端AI佈局,同時也是其在繼續釋放訊號:AI重心繼續從“訓練規模”轉向“推理系統”。具體來看,輝達發佈了推理上下文儲存平台(Inference Context Memory Storage Platform),這是一個專為推理場景設計的AI原生儲存平台。該平台由BlueField-4 DPU與Spectrum-X乙太網路支撐,在GPU與傳統儲存之間引入新的儲存層,用於高效管理和共享KV Cache,減少重複計算帶來的算力浪費。同時,黃仁勳特別強調了物理AI。在更長期的佈局上,輝達圍繞物理AI推進,發佈了一系列開源模型、開發框架和硬體平台,將AI能力從資料中心延伸至機器人、自動駕駛與工業邊緣場景。黃仁勳表示:“AI已經不再是一次性問答的聊天機器人,而是能夠理解物理世界、進行長期推理、使用工具完成真實工作,並同時保有短期和長期記憶的智能協作者。”面向機器人領域,輝達發佈了Cosmos與GR00T系列開源模型,用於機器人學習、推理與動作規劃。其中,Cosmos Reason 2是一款推理型視覺語言模型(VLM),使機器能夠“看見、理解並在物理世界中行動”;GR00T N1.6 則是一款面向類人機器人的推理型視覺-語言-動作(VLA)模型,用於解鎖全身控制能力。“機器人領域的ChatGPT時刻已經到來,”黃仁勳表示,“能夠理解現實世界、進行推理並規劃行動的物理AI模型,正在解鎖全新的應用場景。輝達覆蓋Jetson、CUDA、Omniverse 以及開源物理AI模型的完整技術堆疊,正在賦能全球合作夥伴,通過AI驅動的機器人重塑各個行業。”在自動駕駛領域,輝達發佈了Alpamayo開源模型家族,定位為面向“長尾場景”的推理型自動駕駛基礎模型。該體系配套發佈了AlpaSim高保真模擬框架以及覆蓋1700多小時駕駛資料的開源資料集,用於訓練和驗證基於推理的自動駕駛系統。黃仁勳表示,輝達的首款AV車將於第一季度在美國推出,其他地區緊隨其後。從Rubin平台的提前亮相,到推理儲存與物理AI的同步推進,輝達正在將AI基礎設施的競爭推向“系統工程能力”。在這一階段,真正拉開差距的,已不只是晶片算力本身,而是從架構、系統到生態的整體交付。 (21世紀經濟報導)